Národní úložiště šedé literatury Nalezeno 8 záznamů.  Hledání trvalo 0.01 vteřin. 
End-to-End Speech Recognition for Low-Resource Languages
Sokolovskii, Vladislav ; Schwarz, Petr (oponent) ; Karafiát, Martin (vedoucí práce)
The automatic speech recognition area has started to adopt end-to-end neural network solutions for creating speech recognizers. However, the data hunger nature of these types of systems allows for the creation of recognizers only for high-resource languages, such as English, Chinese or Spanish. In low-resource scenarios, some solutions which alleviate the data scarcity problem have to be developed. One of the most effective techniques for this is fine-tuning a pre-trained model. The problem with the existing approaches of fine-tuning is that the token set of target and source languages does usually differ. That is why previous multi-lingual transfer learning approaches required the output layer to be changed, or mixed tokens from different languages in the output layer, or use universal token sets, or have separate output layers per language. This is undesirable because the sharing across languages in this case latent and not controllable in the output space when the language-specific graphemes are disjoint. Therefore this work proposes to map the tokens to the common set before the beginning of the pre-training. The existing solution was a transliteration of the source language to the target one, the novel approach is romanization where the token set of the target language is romanized to match the English alphabet. Subsequently, the diacritics from the romanized hypotheses can be restored using an additional restoration model. This has the advantage of increasing sharing in the output grapheme space.
End-to-End Speech Recognition for Low-Resource Languages
Sokolovskii, Vladislav ; Schwarz, Petr (oponent) ; Karafiát, Martin (vedoucí práce)
The automatic speech recognition area has started to adopt end-to-end neural network solutions for creating speech recognizers. However, the data hunger nature of these types of systems allows for the creation of recognizers only for high-resource languages, such as English, Chinese or Spanish. In low-resource scenarios, some solutions which alleviate the data scarcity problem have to be developed. One of the most effective techniques for this is fine-tuning a pre-trained model. The problem with the existing approaches of fine-tuning is that the token set of target and source languages does usually differ. That is why previous multi-lingual transfer learning approaches required the output layer to be changed, or mixed tokens from different languages in the output layer, or use universal token sets, or have separate output layers per language. This is undesirable because the sharing across languages in this case latent and not controllable in the output space when the language-specific graphemes are disjoint. Therefore this work proposes to map the tokens to the common set before the beginning of the pre-training. The existing solution was a transliteration of the source language to the target one, the novel approach is romanization where the token set of the target language is romanized to match the English alphabet. Subsequently, the diacritics from the romanized hypotheses can be restored using an additional restoration model. This has the advantage of increasing sharing in the output grapheme space.
Lingvistická analýza historického textu Augustina Mitise Kázání o povětří
Voráčková, Hana ; Šmejkalová, Martina (vedoucí práce) ; Palkosková, Olga (oponent)
Předmětem práce Lingvistická analýza historického textu Augustina Mitise Kázání o povětří je jazykový rozbor tisku Kázanj O Powětřj, který pochází z roku 1620 a jehož autorem je utrakvistický kněz Augustin Mitis. Práce je rozdělena na dvě části - teoretickou a praktickou. V teoretické části je popsán pravopis a jazyk doby humanismu. V teoretické části jsou představeny výsledky analýzy jazykových rovin: ortografické, fonetické, morfologické, lexikální a syntaktické. Při tvorbě práce byla využita kvalitativní analýza textu, která je doplněna kvantitativní analýzou. Pro potřeby práce byla vytvořena transliterace celé památky, která je přiložena jako příloha práce. Jako doplňkový výzkum byly analyzovány dvě stránky tisku Wýklad Modlitby Boží, který pochází ze stejné tiskárny jako zkoumaný tisk. V kapitole o pravopisu je popsán použitý bratrský pravopis. Větší odchylky od tohoto úzu nalezneme jen u tisku dvojího l, záznamu hlásky j a označování kvantity. Analýza hláskových změn ukázala, že sledované změny se v tisku projevují velmi málo. Kapitola o tvarosloví se zabývá zastoupením jednotlivých slovních druhů a gramatickými kategoriemi jmen a sloves. V kapitole o slovotvorbě jsou popsány způsoby tvoření slov. Syntaktická analýza se zaměřila jak na analýzu souřadného a podřadného souvětí, tak i na analýzu větných...
Jazyková stránka vybrané staročeské památky
Mohlesová, Lucie ; Šmejkalová, Martina (vedoucí práce) ; Palkosková, Olga (oponent)
Předmětem této diplomové práce je jazykový rozbor románu o Apollonovi, který je obsažen v Pinvičkově sborníku, pocházejícím z druhé poloviny 15. století. Při tvorbě práce je využíváno zejména kvalitativní analýzy textu, již ve větší části diplomové práce doplňuje kvantitativní statistická analýza. Úvodní části práce představují obecné poučení o Pinvičkově sborníku, v němž se zkoumaná památka nachází, a o památce samotné. Následuje podrobný rozbor pravopisu a všech jazykových rovin, tj. hláskosloví, tvarosloví, skladby a slovotvorby. Každému jazykovému plánu i ortografii je věnována samostatná kapitola. V kapitole věnované pravopisu je pozornost soustředěna především na hlásky, které se vyznačují nejednotným způsobem zápisu. V části hláskoslovné je pojednáno o hláskových změnách, které se v textu uskutečňují. Oddíl tvaroslovný se zabývá zastoupením jednotlivých slovních druhů a zejména pak gramatickými kategoriemi jmen a sloves. V kapitole pojednávající o syntaktické rovině jsou zkoumána souřadná i podřadná souvětí a jednotlivé větné členy. V části slovotvorné jsou rozebrány způsoby tvoření slov v analyzované literární památce. V závěru každé kapitoly je provedeno shrnutí získaných poznatků, jehož součástí jsou také grafy a tabulky. Přílohu diplomové práce tvoří transliterovaný text zkoumaného románu...
Přepis a jazykový rozbor 13. kapitoly proroka Daniela z Mikulovské bible
Jendelová, Alice ; Rejzek, Jiří (vedoucí práce) ; Dittmann, Robert (oponent)
Tato bakalářská práce zpracovává téma Přepis a jazykový rozbor 13. kapitoly proroka Daniela z Mikulovské bible. Jejím cílem je stručně shrnout historii překladatelství bible v českých zemích. Dále představit zkoumaný text z Mikulovské Bible, který dosud nebyl zpracován a jeho literární a historické zařazení. Práce zahrnuje také transliteraci a transkripci textu včetně jejího okomentování. Dále se již zabývá jazykovým rozborem zkoumaného textu z hlediska pravopisu, hláskosloví, tvarosloví a syntaxe. Klíčová slova Mikulovská bible, transliterace, transkripce, jazykový rozbor, pravopis, hláskosloví, tvarosloví, syntax
Komplexní studium Rukopisu dzikovského se zaměřením na grafickou, jazykovou a textovou analýzu české sbírky kázání
Svobodová, Andrea ; Dittmann, Robert (vedoucí práce) ; Kosek, Pavel (oponent) ; Komárek, Karel (oponent)
Mgr. Andrea Svobodová Komplexní studium Rukopisu dzikovského se zam ením na grafickou, jazykovou a textovou analýzu eské sbírky kázání A Comprehensive Study of The Dzikowian Manuscript Focusing on a Graphic, Language and Textual Analysis of the Czech Postil Abstrakt Cílem p edkládané diserta ní práce je popsat a filologicky prozkoumat dosud málo probádaný pozdn st edov ký Rukopis dzikovský, který obsahuje latinská ned lní a sváte ní kázání a eská kázání na dni svatých, a zasadit jej do širšího kontextu st edov kého kazatelství prost ednictvím kritického zhodnocení dosavadního bádání a hledání nových souvislostí. Práce je rozd lena do t í kapitol, jejichž spole ným tématem je atribuce obou sbírek na základ rozboru stránky nejen kodikologické a obsahové, ale zejména stránky jazykové. T žišt m práce je popis jednotlivých jazykových rovin s d razem na p epis nestandardních jev , jejichž interpretace byla klí ovým úkolem pro vyvození transkrip ních ešení (jedním z hlavních výsledk je krom zp esn ní lokalizace a datace rukopisu také transkribovaný p epis celé staro eské sbírky). Popsané jevy rozši ují inventá dosud popsaných odchylek, vyzývají k hledání vztahu k jev m dochovaným v pramenech, které jsou tradi n ozna ovány jako ná e ní, a tedy k formování historické dialektologie. Práce je doprovozena n kolika...
The Transliteration Problems of Russian Cyrillic in Graphic Czech System and Vice Versa
PITŘÍK, Jaroslav
Bakalářská práce se zabývá problematikou transliterace do grafického systému českého a ruského jazyka. Teoretická část je zaměřena na pravidla, způsoby a doporučení pro přepis latinského písma do azbuky a naopak. Praktická část je sestavena ze čtyř výběrových přehledů: přehled českých a ruských geografických názvů, přehled významných historických i současných českých a ruských osobností.
(Polo)automatická počítačová transkripce
Lehečka, Boris ; Voleková, Kateřina
Článek představuje nástroje Brus a Transkriptor, které se uplatňují při vydávání staročeských a středněčeských písemných památek.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.